主成分分析(PCA)是一种常用的统计与机器学习降维方法:把一组可能相关的变量转换为若干个相互正交(不相关)的“主成分”,在尽量保留数据主要信息(方差)的同时,用更少的维度表示数据。除“降维”外,PCA也常用于可视化、去噪和特征压缩。
/ˌprɪnsəpəl kəmˈpoʊnənt əˈnæləsɪs/
We used principal component analysis to reduce the number of features before training the model.
我们在训练模型之前使用主成分分析来减少特征数量。
Principal component analysis revealed that two components explained most of the variance, separating samples by temperature and humidity effects.
主成分分析显示两个主成分解释了大部分方差,并按温度与湿度的影响把样本区分开来。
“Principal”源自拉丁语 princeps,有“首要的、主要的”之意;“component”来自拉丁语 componere(组合);“analysis”来自希腊语 analysis(分解、解析)。合起来,“principal component analysis”字面意思就是“对主要成分进行分析”,指找出数据中最能代表整体变化的方向(成分)。